Skip to main content

5.14.2 Kaplan-Meier

Dette er den enkleste og kanskje vanligste typen overlevelsesanalyse. Standardresultat fra en slik analyse er kaplan-meier-grafer som typisk viser en trappetrinnformet kurve som går nedover langs x-aksen (tid). Selve kurven viser overlevelsesraten som funksjon av tid, og er gitt vedfølgende formel:

I tillegg til grafer vises også nøkkeltall for den aktuelle analysepopulasjonen. Kaplan-Meier kan også brukes til å lage bivariat analyse av overlevelsesraten der man ser på forskjeller mellom grupper av populasjonen. Dette gjøres gjennom bruk av en by-opsjon der man kan vise separate kurver for hver gruppe i en og samme graf.

Kaplan-Meier er en ikke-parametrisk analyseform for enkle overlevelsesanalyser, men kan også brukes som hjelpeverktøy for å sette opp mer avanserte analyser, f.eks. multivariate Cox-analyser: Ved å studere Kaplan-Meier-grafer kan man sammenlikne overlevelsesratene for de ulike gruppene av individer man grupperer gjennom forklaringsvariabler, og se om det er signifikante forskjeller i overlevelsesraten mellom f.eks. kvinner og menn. Om kurvene ikke overlapper, er dette et tegn på at den aktuelle forklaringsvariabelen kan benyttes som forklaringsvariabel til en multivariat analyse.

Tilrettelegging av data

Etter at datasettet er tilrettelagt for overlevelsesanalyse, jfr. kap. 5.14.1, kan du kjøre en Kaplan-Meier-analyse gjennom å bruke kommandoen kaplan-meier der man først angir variabelen «hendelse» og deretter «tid» (rekkefølgen er viktig).

Eksempler:

Typiske resultat:

Måleperiode 2010-01-01 - 2019-12-15. Utvalgsstørrelse = 10000. Hendelse = arbeidsledig. Tid = antall år. Gruppert på aldergrupper målt i 2010.


Samme datasett som figur over, der tid = antall dager.


TOLKNING AV RESULTAT
  • Kurvene er gitt ved Kaplan-Meier-formelen for hver av aldergruppene. De yngste kommer best ut med en høyere «overlevelsesgrad» (blir i mindre grad arbeidsledige over tid).

  • De skraverte områdene representerer standard log-log 5% konfidensintervall tilknyttet overlevelsesraten for hver av aldersgruppene. Disse vil være mindre synlig ved store populasjoner.

  • «Akkumulert overlevelsestid»: Summen av tid målt over alle enheter i populasjonen (innen hver aldergruppe).

  • «Hendelsesrate»: Antall hendelser inntruffet (antall enheter med hendelse = 1) dividert med «akkumulert overlevelsestid».

  • «Antall»: Antall enheter (for hver av aldersgruppene).

  • «75%»: Tid målt der hvor overlevelsesraten = 0.75 (for hver av aldergruppene).

  • «50%»: Tid målt der hvor overlevelsesraten = 0.5 (for hver av aldersgruppene). Også kalt «median overlevelsestid».

  • «25%»: Tid målt der hvor overlevelsesraten = 0.25 (for hver av aldersgruppene).


Grafisk fremstilling av overlevelsesrater og personvern

kaplan-meier-grafer fremstiller faktiske endringer i overlevelsesrater (og ikke estimerte). Det har i enkelte situasjoner vist seg å være vanskelig å beskytte personvernet optimalt uten å støylegge endringene i overlevelsesratene som tegnes i grafen. Men det har også vist seg vanskelig å støylegge disse endringene uten å introdusere for stor usikkerhet med tanke på tolkning av kaplan-meier-grafene, fordi støyleggingen har en kumulativ effekt over tidsperioden.

Vi har derfor valgt å fjerne den grafiske fremstillingen for kommandoen kaplan-meier. De mindre detaljerte hovedtallene under grafen beholdes, og kan brukes som før.

For kommandoen weibull baserer de genererte overlevelsesgrafene seg på estimerte/predikerte overlevelsesrater (med utgangspunkt i de faktiske observasjoner), og personvernutfordringene er vesentlig mindre.

Om det viktigste for deg er å lage grafiske fremstillinger av overlevelsesrater, anbefaler vi derfor å benytte kommandoen weibull. Merk at hovedtallene hentes ut fra den estimerte grafen, og at tallene derfor har en viss unøyaktighet i forhold til det kaplan-meier rapporterer. Om korrekte tall er det viktigste, anbefaler vi å bruke kaplan-meier som fortsatt produserer en tabell. De to kommandoene kan også kombineres. Men da må det tas forbehold om at weibull-grafene viser den trendmessige utviklingen, og ikke de faktiske/ observerte endringer.


\rhd Eksempel: Tilrettelegging av data for overlevelsesanalyser, deriblant Kaplan-Meier- og Weibull-analyser